期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于自监督视觉Transformer的图像美学质量评价方法
黄荣, 宋俊杰, 周树波, 刘浩
《计算机应用》唯一官方网站    2024, 44 (4): 1269-1276.   DOI: 10.11772/j.issn.1001-9081.2023040540
摘要118)   HTML0)    PDF (3071KB)(126)    收藏

现有的图像美学质量评价方法普遍使用卷积神经网络(CNN)提取图像特征,但受局部感受野机制的限制,CNN较难提取图像的全局特征,导致全局构图关系、全局色彩搭配等美学属性缺失。为解决该问题,提出基于自监督视觉Transformer(SSViT)模型的图像美学质量评价方法。利用自注意力机制建立图像局部块之间的长距离依赖关系,自适应地学习图像不同局部块之间的相关性,提取图像的全局特征,从而刻画图像的美学属性;同时,设计图像降质分类、图像美学质量排序和图像语义重构这3项美学质量感知任务,利用无标注的图像数据对视觉Transformer(ViT)进行自监督预训练,增强全局特征的表达能力。在AVA(Aesthetic Visual Assessment)数据集上的实验结果显示,SSViT模型在美学质量分类准确率、皮尔森线性相关系数(PLCC)和斯皮尔曼等级相关系数(SRCC)指标上分别达到83.28%、0.763 4和0.746 2。以上实验结果表明,SSViT模型具有较高的图像美学质量评价准确性。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于注意力机制和元特征二次重加权的小样本目标检测
林润超, 黄荣, 董爱华
《计算机应用》唯一官方网站    2022, 42 (10): 3025-3032.   DOI: 10.11772/j.issn.1001-9081.2021091571
摘要373)   HTML17)    PDF (2381KB)(186)    收藏

在基于迁移学习的小样本目标检测任务中,由于缺乏关注图像中待检测目标的注意力机制,所以现有模型对于待检测目标周边背景区域的抑制能力不强,且在迁移学习过程中通常需要对元特征进行微调来实现跨域共享,这将引起元特征偏移,从而导致模型对大样本图像检测能力的下降。针对上述问题,基于注意力机制和元特征二次重加权机制,提出改进的元特征迁移模型Up-YOLOv3。首先,在原始元特征迁移模型Base-YOLOv2中引入基于卷积块注意力模块(CBAM)的注意力机制,使特征提取网络聚焦于图像中的目标区域并关注图像目标类别的细节特征,从而提升模型对小样本图像目标的检测性能;其次,引入基于压缩?激励(SE)的元特征二次重加权模块(SE-SMFR)对大样本图像的元特征进行二次重加权,以获取二次重加权元特征,使模型在提升小样本目标检测性能的同时也能减小大样本图像元特征信息的权重偏移。实验结果表明,在PASCAL VOC2007/2012数据集上,相较于Base-YOLOv2,Up-YOLOv3针对小样本图像检测的平均准确率均值(mAP)提升了2.3~9.1个百分点;相较于原始的基于YOLOv3元特征迁移模型Base-YOLOv3,Up-YOLOv3针对大样本图像的mAP提升了1.8~2.4个百分点。可见,改进后模型对不同类别的大样本图像和小样本图像均具有良好的泛化能力和鲁棒性。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于时间上下文跟踪学习检测的指尖跟踪方法
侯荣波, 康文雄, 房育勋, 黄荣恩, 徐伟钊
计算机应用    2016, 36 (5): 1371-1377.   DOI: 10.11772/j.issn.1001-9081.2016.05.1371
摘要502)      PDF (1198KB)(405)    收藏
针对在基于视频的空中签名认证系统中,现有方法无法满足指尖跟踪的准确性、实时性和鲁棒性要求的问题,在对比研究目前常用的多种跟踪方法的基础上,提出一种基于时间上下文的跟踪-学习-检测(TLD)方法。在原始TLD算法的基础上引入时间上下文信息,即相邻两帧间指尖运动具有连续性的先验知识,自适应地缩小检测和跟踪的搜索范围,以提高跟踪的速度。对12组公开的1组自录的视频序列的实验结果表明,改进后的TLD算法能够准确地跟踪指尖,并且跟踪速度达到43帧/秒;与原始TLD跟踪算法相比,准确率提高了15%,跟踪速度至少提高1倍,达到了指尖跟踪的准确性、实时性和鲁棒性要求。
参考文献 | 相关文章 | 多维度评价